0
本文作者: 周蕾 | 2020-06-14 09:44 | 專題:金融聯(lián)邦學習公開課 |
近日,香港人工智能與機器人學會(HKSAIR)創(chuàng)會理事長、微眾銀行首席AI官、香港科技大學講席教授楊強老師,領(lǐng)銜HKSAIR《AI金融》系列線上講座第一課,主講聯(lián)邦學習及其四大應用場景。
以下為楊強教授演講全文,雷鋒網(wǎng)做了不改變原意的整理:
我們這次的課程系列,與當前大家在工業(yè)界和學術(shù)界非常重視的一個議題相關(guān),就是如何利用數(shù)據(jù)做人工智能的模型,同時又能夠保護用戶的隱私,保護數(shù)據(jù)的安全。
很多同學聽說過深度學習,聽說過監(jiān)督學習,可能沒有聽說過聯(lián)邦學習。這個也是要給大家交代一下聯(lián)邦學習的由來。
為什么我在微眾銀行建立AI團隊?我在觀察金融的各個方面能不能用AI的模型給包裝起來。因此我們設(shè)計了以下四大版塊,產(chǎn)品和業(yè)務已經(jīng)出爐,可以說是“AI落地急先鋒”。
詳細說一下AI+服務,比如開戶驗證身份要進行人臉/語音/指紋識別,又比如小微企業(yè)的企業(yè)主申請企業(yè)貸款上傳執(zhí)照要通過OCR圖像識別、文字識別獲取,自動產(chǎn)生信用評估?,F(xiàn)在AI+服務大概每天能處理百萬以上的這種需求。
以語音識別為例,我們做到了自主自研,與眾多業(yè)界領(lǐng)先的語音識別的提供者相比具有明顯優(yōu)勢,一是因為我們金融領(lǐng)域的知識,有大量特定話術(shù)和專業(yè)詞匯的儲備,在各種具體的特殊環(huán)境下都能處理。二是我們有非常先進的聯(lián)邦學習技術(shù),這就是今天的主題。還有遷移學習,可以很快把通用模型適配到特殊的場景。
AI+營銷,有了產(chǎn)品也要有能力傳播出去,找到對的人和企業(yè),去提供金融服務。
怎么找到正確的需求?比如微信朋友圈,大家有時候會看到小微企業(yè)貸款廣告,說明系統(tǒng)“認出”你是一個小微企業(yè)主。我們通過很多的特征來識別,很快賦予額度給小微企業(yè)的企業(yè)主,秒級批準。另外,推薦系統(tǒng)是非常有用的一個技術(shù),我們把推薦系統(tǒng)和遷移學習、聯(lián)邦學習結(jié)合起來,形成了新的技術(shù)優(yōu)勢,后面會細說。
在金融行業(yè)一個很大的優(yōu)勢,就是風控非常嚴格,要高效做信用評估,那就需要很多數(shù)據(jù),360°來觀察企業(yè)或者申請貸款的用戶。但同時又不希望這些數(shù)據(jù)的隱私被暴露,如何能夠做到這一點?這,就是聯(lián)邦學習要做的事情。
舉例:金融保險定價,我們把違約概率大幅縮減,個性化的保險定價提升8倍。小微企業(yè)風控模型準確率提高,相應地,壞賬率降低。
我們有一個叫做攬月的產(chǎn)品,是從衛(wèi)星視角往下看,能看到企業(yè)的經(jīng)營狀況,比方說左下角可以通過卡車個數(shù)和活躍度看到礦業(yè)的經(jīng)營狀況。右上角是農(nóng)業(yè)種植區(qū)域,可以通過衛(wèi)星評估產(chǎn)量。左上角是洪水泛濫受災地區(qū),通過衛(wèi)星對地區(qū)受災的程度進行定價。右下角是煙囪污染,環(huán)境在投資里是社會價值的體現(xiàn),對環(huán)境的保護體現(xiàn)了公司治理水平,相應產(chǎn)生的ESG指數(shù),很多也來自于于衛(wèi)星圖像觀察。
綜上所述,這4個版塊,2個是前端的(服務、營銷),2個是后端的(風控、資管)。
在這個過程中,數(shù)據(jù)是非常缺乏的。要保護我們的隱私,同時也想要服務,怎么做到?下面這句話叫做“數(shù)據(jù)不動,模型動”,希望大家就記住這7個字。這個就是聯(lián)邦學習的精髓。
AlphaGo出現(xiàn)以后,人工智能井噴式發(fā)展。但我們周圍日常的生活,有的卻是小數(shù)據(jù),不要以為大公司就一定有大數(shù)據(jù)。像在金融里面有很多的數(shù)據(jù),其實是黑天鵝現(xiàn)象。比方說在反洗錢應用中用于模型訓練的洗錢案例,其實數(shù)量并沒有想象中那么多,還是屬于少數(shù)現(xiàn)象。這種數(shù)據(jù)拿它來訓練,效果不是很好。在醫(yī)療也是這樣,每天都有那么多的病人,一定是大數(shù)據(jù)嗎?
有一家公司叫做第四范式,用人工智能賦能金融場景。有很多頭部銀行都在使用它的產(chǎn)品,其中一個案例很有意思:豪車這種大額貸款,如果要建一個模型來做這種大額貸款的信用度的評估,數(shù)據(jù)往往是在上百例以內(nèi),這點樣本是沒有辦法訓練一個好的深度模型的,或許可以來訓練 support vector machine(支持向量機)或decision tree(決策樹),但往往不精確。
又比如,大家都很憧憬無人車的到來,但遲遲不來,其中一個重要的原因,就是因為無人車還不靠譜。我們不知道它見到一個它沒見過的情況會發(fā)生什么,為了應付這種情況,可不可以把所有汽車上面的傳感器、攝像頭的數(shù)據(jù)全部聚合在一起,飛快地訓練一個無人車的視覺模型?不行,因為每一個在路上的車輛,雖然它可以收集自己前面的影像數(shù)據(jù),但是它不肯把這個數(shù)據(jù)和別人去共享,因為它有很多出行隱私在里面。即使這些無人車都是跟云端在連接的,模型卻沒有辦法及時更新。
很多類似的端計算場景,就沒有辦法真正的實現(xiàn),因為數(shù)據(jù)的割裂和短缺。
能不能把這些眾多的小數(shù)據(jù)集給聚合起來,成為大數(shù)據(jù)?過去,確實是這樣做的?,F(xiàn)在,這樣做的結(jié)果就是違規(guī)。
比方說,歐洲在18年就推出了一個非常嚴格的個人隱私法規(guī),說數(shù)據(jù)的擁有權(quán)是絕對在終端用戶那里。如果服務器端的公司,要用戶的數(shù)據(jù)來訓練某個模型,比方說搜索引擎的模型,它就一定要得到用戶的許可。假設(shè)明天它要用同樣的數(shù)據(jù)去訓練推薦引擎的模型,那又得到用戶那去,得到新的許可。用戶如果哪天說不希望你用我的數(shù)據(jù)在你的模型里了,那么從此以后,這個公司就沒有辦法用用戶的新的數(shù)據(jù),這個叫“被遺忘權(quán)”。
很多巨頭因此被罰,Google就被罰了5000多萬歐元, Facebook也遭受了滑鐵盧。
在國內(nèi),數(shù)據(jù)的隱私保護已經(jīng)是處于一個非常嚴格的態(tài)勢,很多大數(shù)據(jù)公司,在過去都是新貴,但是現(xiàn)在都變成了階下囚。我們現(xiàn)在在國內(nèi)的銀行里面工作,深知數(shù)據(jù)是紅線,萬萬碰不得的。
應該說,聯(lián)邦學習現(xiàn)在已經(jīng)變成了國內(nèi)外的技術(shù)上的一個重大趨勢,并且它已經(jīng)是一個跨領(lǐng)域的概念,它不僅僅是技術(shù),而且是商業(yè),它有自己的商業(yè)模式。
在過去,數(shù)據(jù)動模型不動,也就是說我們從各地來購買數(shù)據(jù),或移動數(shù)據(jù)到一個中心點,在中心點建立模型。
用一個簡單的例子來給大家進行解釋:假設(shè)用一只羊來類比機器學習模型,草就是數(shù)據(jù),我們希望羊吃了草以后能夠長大。過去的做法是,把草買到一起來建立模型。比方說左邊的模型,左邊的箭頭是指向羊的。羊不動,但是草被購買到中心。相當于用簡單粗暴的辦法來獲取數(shù)據(jù),形成大數(shù)據(jù),來建立模型。
但我們希望能夠保護各自的隱私,所以讓草不動,讓羊動。這樣羊既能吃那個地方的草,主人又不知道到底吃了哪些草,久而久之羊就長大了——這個就是聯(lián)邦學習的新思路,就是讓草不出草場,本地主人無法知道羊吃了哪些草,但是羊還是長大了。
比如每一個手機都是我們個人在使用,形成了一堆樣本。有不同的手機,每個手機基本上取的這些特征都一樣,但樣本卻不同。我們希望在數(shù)據(jù)不動的情況下,能夠聚合這些手機上的數(shù)據(jù)的這些能力,建立大數(shù)據(jù)模型。
左邊所示的數(shù)據(jù)集們,依次對應右邊各終端上面的數(shù)據(jù)。它們的特征是縱向的,X1、X2、X3是類似的,但樣本U1、U2…U10卻是不同的。所以這個叫橫向切割,按樣本切割,簡稱“橫向聯(lián)邦學習”。
我們可以在本地建一個粗糙的模型,用w來表達它的參數(shù),同時對參數(shù)加密。有密鑰的人才可以看到內(nèi)涵,別人和服務器也看不到加密后數(shù)據(jù)包里的內(nèi)容。服務器得了加密后的參數(shù),就可以通過某種形式,把這些加密后的參數(shù)加以更新、聚合、處理,形成一個更大的模型。
這里大家可能會有疑問,你得到的是一個加密的包,是一堆亂碼,怎么可以把兩堆亂碼加到一起?還成為一個有意義的模型?這個問題,我留在下一頁來解決。
每一個地方的數(shù)據(jù),就對應這里有一個顏色的小表格,行是每一個用戶的數(shù)據(jù),列是每一維的特征??梢钥吹竭@個特征在不同終端上的特征是類似的,但是用戶不一樣。按照用戶來切割,并沒有按照特征來切割。
有了這樣的一個形態(tài)以后,我們就可以把剛才給大家講的故事,寫成一個算法。這個算法里最關(guān)鍵的第4步是把運到服務器端的加密模型,這些包用一個f函數(shù)來處理,它是一個機器學習算法,作用在參數(shù)上。
我們原來有這么一種新型的加密算法,他可以讓機器學習的算法可以穿透加密層進到內(nèi)涵,也就是說我們對一堆加密包的某種數(shù)學運算,相當于對于某種數(shù)學運算的加密。這其實是一個小學的概念,叫做distribution law(分配律)。
同態(tài)加密,可以把多項式的加密,分解成每項加密的多項式,A+B的加密,變成A的加密加B的加密,這是非常偉大的貢獻。因為這樣就使得我們可以拿一個算法,在外面把算法給全部加密,加密的一層可以滲透到里面的每個單元。
安卓系統(tǒng)利用剛才所說的橫向切割,即橫向聯(lián)邦學習的方法,不斷更新一個總的模型,并且把總的模型分配到本地。在這個過程當中沒有數(shù)據(jù)移出本地,并且即使在云端在進行運算的過程當中,也不會偷窺到任何的這個參數(shù)和任何的數(shù)據(jù)本身。所以,谷歌的安卓系統(tǒng)現(xiàn)在已經(jīng)在使用,通過基博爾系統(tǒng)對輸入法進行更新。
如果是某互聯(lián)網(wǎng)公司和某家銀行合作,并不按照樣本切分,這兩家可能具有同樣的樣本,用戶群類似,但卻有不同的特征。這種情況下,數(shù)據(jù)其實是按照特征縱向來切割的,所以我們管這個模式叫做縱向聯(lián)邦學習。
比方說兩家數(shù)據(jù)擁有方各自建立一部分的模型,但是在建立的過程當中,它需要知道那一部分模型所計算的結(jié)果和梯度,計算的梯度來告訴最后的結(jié)果是在往哪個方向發(fā)展,這需要一個gradient和一個era。在交換過程中,又引入剛才所說的同態(tài)加密的算法,使得兩邊可以在不看對方數(shù)據(jù)內(nèi)容的情況下,不斷更新自己這一部分的模型。
這是訓練的過程,我們還有使用的過程。使用的過程叫inference,也需要兩方來進行。也就是說,如果有一方到一半的時候說不合作了,那么聯(lián)邦模型就應該停止,這個效果也是可以實現(xiàn)的。
我們現(xiàn)在講了兩種模式,一種是橫向聯(lián)邦,那么橫向聯(lián)邦更多的是to c。to b 是幾家公司有意愿合作,可能數(shù)目不多,但每一個地方的數(shù)據(jù)都是客觀的。在這種情況下,他們要做出1+1>2的效果,就可以用縱向聯(lián)邦來進行。
問:聯(lián)邦學習和分布式機器學習最能區(qū)分的點是什么?
可能以前做機器學習的同學做過分布式機器學習,比方說有參數(shù)服務器這樣的概念。分布式機器學習,目的是加速,加速的辦法是通過網(wǎng)絡、多個服務器的平行并行計算。它就要考慮把這個數(shù)據(jù)給切分成不同的塊,使得每一塊的計算是在不同的服務器上進行的,但是每一塊它的分布又是差不多的。
但在聯(lián)邦學習中,我們不能保證所有的數(shù)據(jù)擁有方,它的數(shù)據(jù)分布是一樣的。分布式機器學習的目標是加速,聯(lián)邦學習的目的是合作,同時保護隱私,所以最終目的還是不一樣。
問:聯(lián)邦學習和安全計算是什么關(guān)系?國外是不是有類似的這種經(jīng)驗?
安全計算應該說是聯(lián)邦學習的重要組成部分,聯(lián)邦學習不是一個孤立的算法,它是一個綜合性的學科,安全計算是為它提供工具的。前面說到安全是用同態(tài)加密來進行,也可以用其它的方法,比方說姚期智院士發(fā)明的Garbled Circuit(混淆電路)。
問:區(qū)塊鏈聽起來和聯(lián)邦學習有點像,都是在多方進行的,它們是不是有些異同?
它的做法可能有些相同,但是也有巨大的不同。相同的地方是它可以用區(qū)塊鏈的分布式記賬功能來進行有效的激勵措施。激勵措施是我剛才所沒有講的,就是說怎么鼓勵參與方持續(xù)地投入,參與到聯(lián)邦里面來。同時去中心化的概念,也是我們尤其是縱向聯(lián)邦里面的一個概念。
但一個很大的不同是,區(qū)塊鏈為了保證 transparency,還有保證數(shù)據(jù)的不可篡改性,那么它要把同樣一份數(shù)據(jù)多次copy到不同的場景,最后大家要有一個vote的機制,但是聯(lián)邦學習卻不然,聯(lián)邦學習是一個數(shù)據(jù),只有一個copy,它不能夠出本地,所以它的目的就是通過這種uniqueness的方法來保證用戶的數(shù)據(jù)的隱私和安全。
還有我們新提出來的虎符性概念,就是多方參與,才能夠計算。缺了一方,這個就無效,就像戰(zhàn)國時代,你要把虎符兩個印要對上才能夠用兵,這個是聯(lián)邦學習的一個優(yōu)點。
問:如果有一方數(shù)據(jù)是壞人怎么辦?
比如橫向聯(lián)邦,如果有一個手機,它其實是壞人,它參與了計算,那么它每次貢獻的模型都是在下毒,也就是說它在把最后的結(jié)果在朝著他對它自己有利的方向發(fā)展,或者在縱向聯(lián)邦的時候,兩方當中,其中有一方,它的目的就是為了窺探對方的隱私, 怎么辦?
在場景下,我們有各種各樣的做法。比方說做OCR,written text是0,這個是原始數(shù)據(jù),我們讓計算機識別0。如果不做加密,我們沒有一個機制,這種所謂的對抗是可以做到的,壞人是可以通過參數(shù)或者一系列梯度的泄露可以反猜原始數(shù)據(jù)。
在建立模型訓練的過程當中,如果這個模型的 gradient不斷被引向到一個第三方,第三方獲取 gradient,最后reconstruct我們就用data,通過這樣的辦法可以去做竊聽。題目也是在去年NIPS得到最佳paper的一個題目,是MIT韓松教授做的。
應付它的方法,也是聯(lián)邦學習的一個拿手好戲。比方說假設(shè)一個player,半誠實(Honest-but-curious)就是好奇,但本身不壞。還有人是惡意的,想搞破壞,想得到用戶隱私,然后獲利。對于不同的假設(shè),可以設(shè)計不同的聯(lián)邦學習算法和多方計算算法來防止下毒,還可以做零知識(Zero knowledge)和一些知識(Some knowledge)分類。服務器端也可以區(qū)分是不是惡意中心、惡意的數(shù)據(jù)節(jié)點和非惡意的數(shù)據(jù)節(jié)點。
問:金融場景有沒有遇到過壞人?
在聯(lián)邦學習里面,如果有同學現(xiàn)在在找題目,說我能不能在聯(lián)邦學習找一個碩士題目或者找一個PHD的topic?完全有的,但是要聚焦,因為聯(lián)邦學習涉及的方面實在是太多了,所以如果你要找一個題目,你往往會找一個子題目,比方說如何能夠做到安全合規(guī),如何能夠設(shè)計一種機制防御攻擊,提高算法效率。
比方說我們科大的陳凱老師,他帶領(lǐng)的團隊就在設(shè)計全世界領(lǐng)先的算法,網(wǎng)絡效率可以通過網(wǎng)絡的設(shè)計,包括網(wǎng)絡protocol、芯片的設(shè)計來提高。還有王威老師、宋陽秋老師,都在設(shè)計算法,他們的算法都是非常精確的。
問:你講模型我還是云里霧里的,模型到底是做什么的?
打個比方,現(xiàn)在每個人都用手機,有時候也看抖音,一看就很長時間過去了。為什么抖音能做到這一點?精準的推薦和個性化,利用數(shù)據(jù)來做推薦系統(tǒng)。
如圖所示,比方說我們有很多的手機,每個手機上都有數(shù)據(jù)。抖音的做法,是把每個手機上的數(shù)據(jù)上傳到云端,再利用所聚集的大數(shù)據(jù)訓練模型,再適配到每一個人的個人數(shù)據(jù)上,就變成個性化推薦模型,再給推到手機端,就是循環(huán)往復這樣一個過程。
這過程有個缺點,就是它侵犯了用戶隱私,每個人的數(shù)據(jù),云端就會看到。怎么防止?這里我就要說聯(lián)邦學習+推薦系統(tǒng),就是聯(lián)邦推薦,這個也是我們第一次提出federated recommendation的一個算法。
它的算法宗旨,就是對每一個手機上的 transaction,用戶以前看過的視頻或者書,進行矩陣分解,得到用戶空間和產(chǎn)品空間。如果你們喜歡數(shù)學,你們可能知道本征值、本征向量,線性代數(shù)里面的概念,實際上就是求這個值,但基于本地數(shù)據(jù)求值是非常不準的。所以通過聯(lián)邦學習,能夠讓他們既能夠利用所有的數(shù)據(jù)來求 ,同時不把本地的數(shù)據(jù)暴露給其他任何人。這就是聯(lián)邦推薦的概念,可以在toB的形勢下實現(xiàn),就是縱向聯(lián)邦。
縱向聯(lián)邦現(xiàn)在應用在哪里呢?又有一個新的名詞,叫做聯(lián)邦廣告。
現(xiàn)在互聯(lián)網(wǎng)的一大經(jīng)濟支柱就是廣告,在現(xiàn)有的廣告架構(gòu)下,廣告是不可避免地侵犯用戶隱私。聯(lián)邦廣告可以讓廣告方、投放的媒體方、用戶方各自保留自己的數(shù)據(jù),同時提高投放準確率。
問:聯(lián)邦學習訓練后的模型是一個公共的模型,而各個客戶端的數(shù)據(jù)經(jīng)常是non-iid的,怎么辦?
聯(lián)邦學習訓練后的模型,是一個公共的模型,而各個客戶端的數(shù)據(jù)經(jīng)常是分布都不一樣,比方說我們有一個手機是女生用的,她看的短視頻和一個男生用的手機的看的短視頻,可能是完全不一樣的短視頻,因此我們拿他們兩個的數(shù)據(jù)粗暴地做數(shù)據(jù)聯(lián)邦,這個效果是肯定不好的,這是機器學習的一個常識。
怎么辦?我們還有元學習,和多任務學習、遷移學習是可以解決non-iid問題的。
又要給大家提一個新名詞,叫做聯(lián)邦遷移學習,在之前每一端都先要做一個聯(lián)邦遷移學習,找到自己的一個子空間,在這個數(shù)據(jù)子空間的比對下,大家可以認識到自己找到的子空間,各自找到子空間是屬于同分布的就可以。那么找到子空間,可以用聯(lián)邦學習來實現(xiàn)。這個領(lǐng)域論文非常的少,所以如果有同學在找題目,我鼓勵大家在這個方面發(fā)力,一定是明年各個頂會的文章,best paper一定是屬于你們的。
假設(shè)我們要給一些小微企業(yè)貸款,又不知道小微企業(yè)的情況,第一個可以問詢的是央行征信,比方說他過去在某個銀行貸過款,信用度如何,但這種數(shù)據(jù),它的樣本往往是非常少的,所以只是去找央行的數(shù)據(jù)遠遠不夠。
我們希望用到的數(shù)據(jù)是多方面的,比如工商、稅務、輿情,還有各種資產(chǎn)的數(shù)據(jù)。但是這些數(shù)據(jù)擁有方,往往都是政府的不同部門、不同的企業(yè)。有專門的公司去幫助這些小微企業(yè)建立電子化的發(fā)票,有從專門的業(yè)務角度觀察,我們只有用聯(lián)邦學習才能說服他們來參與,否則他們擔心核心資產(chǎn)會被泄露。
這里的例子,是我們在企業(yè)貸款里面基于聯(lián)邦學習的風險控制模型。某個銀行和某個發(fā)票企業(yè)最后形成聯(lián)邦,大為提升準確率,降低壞賬率。
保險其實就是風險,風險和數(shù)據(jù)是分不開的,數(shù)據(jù)越多,風險越低,因此保險公司在某些程度上也想合作,因為不同的保險公司有不同的數(shù)據(jù)。有的保險公司是專門為保險公司保險的,叫做再保險公司,比方說瑞士再保險公司,是世界上最大的再保險公司,有100多年的歷史,這些公司在過去因為數(shù)據(jù)割裂,沒有辦法合作的?,F(xiàn)在就在用聯(lián)邦學習,而且取得了非常好的效果。
比方說我們有不同的攝像頭,每個攝像頭都覆蓋一個區(qū)域,這個地方的數(shù)據(jù)是公司的核心資產(chǎn),不愿意和別的公司去share,但是他又希望利用到別的公司的數(shù)據(jù),來增高自己的準確度,這個時候就可以用到聯(lián)邦學習,我們叫視覺聯(lián)邦,已經(jīng)落地實施。每天深圳的建筑工地用來探測危險,影響施工的一些現(xiàn)象,比方說明火抽煙和不戴安全帽的現(xiàn)象。
另外,語音識別、IOT在倉儲管理的場景,聯(lián)邦學習也有所應用。不同的倉庫可以形成線性聯(lián)邦,監(jiān)測地方倉儲狀況,這些狀況就為風控模型和為物流業(yè)的決策提供了保障。
我們最近和騰訊的天眼實驗室合作,成功構(gòu)建了一個“腦卒中發(fā)病風險預測模型”,通過使用來自就診記錄數(shù)量TOP5的醫(yī)院真實就診數(shù)據(jù)驗證,聯(lián)邦學習模型和集中訓練模型表現(xiàn)幾乎一致,在腦卒中預測模型中的準確率達到80%,僅比集中訓練模型準確率降低1%。
同時,聯(lián)邦學習技術(shù)顯著提升了不同醫(yī)院的獨立模型效果,特別是,對于兩家腦卒中確診病例數(shù)量較少的醫(yī)院而言,聯(lián)邦學習分別提升其準確率10%和20%以上。
聯(lián)邦學習不僅僅是一個算法,而是一個操作系統(tǒng)。因為有激勵機制在里面,可以把不同的行業(yè)給凝聚在一起,使得大家有動力,不斷用聯(lián)邦學習來做聯(lián)盟。除了剛才提到的場景,還有銀行和監(jiān)管聯(lián)合跨境反洗錢,互聯(lián)網(wǎng)+保險,互聯(lián)網(wǎng)+銀行風控,互聯(lián)網(wǎng)+零售,這些問題都可以通過聯(lián)邦學習更好解決。
我們建立生態(tài),建立平臺,建立標準。也希望這個不僅僅是一個算法,而是新的paradise。我有的時候跟媒體講,AlphaGo代表了AI 1.0,它就是說在一個地方有數(shù)據(jù),在一個地方有算法,在一個地方可以有一個很好的模型,就是AlphaGo。
現(xiàn)在我們進入了AI 2.0,我們在不同的地方有數(shù)據(jù)、算法、業(yè)務,我們還可以做AI,這個是谷歌所沒有做到的,中國現(xiàn)在在這個方向是領(lǐng)頭的。
怎么做到這一點?首先要建立標準。我們特別自豪的一點是,世界上第一個聯(lián)邦學習的產(chǎn)業(yè)聯(lián)盟,建立的IEEE的標準,已經(jīng)到了最后一步,馬上就要正式發(fā)布了,敬請關(guān)注。同時在國內(nèi),有聯(lián)邦學習的團體標準,這個也是微眾銀行領(lǐng)銜發(fā)布。我們有一個聯(lián)邦學習的開源平臺,就在Linux Foundation上,是金牌的開源平臺,短短兩個月就收集到貢獻者打的上千星,到現(xiàn)在已經(jīng)2000以上。在短時間得到這樣的認可,也是非常難得。
教育方面,我們先后出版了英文和中文版,是聯(lián)邦學習第一本書。另外還在做一個專題網(wǎng)頁,提供教學PPT、習題、考試題,為師生提供方便,希望大家都能夠很快了解這個領(lǐng)域,并且參與到里面來。
欲收看本系列課程回放,請掃描下方海報二維碼進入專題頁面,或點擊https://www.yanxishe.com/course?from=indexmap觀看。
雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。